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© Chromatin-Regulatorgene 

(§7) Die Deregulation von Chromatinregulator-Genen, die eine 
SET-Domane aufweisen, spielt eine Roile bei bestimmten 
Krebserkrankungen. Diese Gene konnen somit, insbesonde- 
re die SET-Domane aJs solche, als Grundlage fur die 
Diagnose und Therapie dieser Erkrankungen dienen. 
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Beschreibung 

Die vorliegende Erfindung bezieht sich auf Gene, die 
eine Rolle bei der Regulation von Chromatin spielen, 
und ihre Verwendung fur die Therapie und Diagnostic 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere, Telomere sowie in eu- 
und heterochromatische Regionen stellt einen entschei- 
denden Mechanismus zur Gewahrleistung der genauen 
Replikation und Verteilung der genetischen Informa- 
tion bei jeder Zellteilung dar. Im Gegensatz dazu sind 
Tumorzellen haufig durch chromosomale Rearrange- 
ments, Translokationen und Aneupioidie charakterisiert 
(Solomon et al, 1991; Pardue, 1991). Obwohl die Mecha- 
nismen, die zu einer erhdhten Chromosomeninstabilitat 
in Tumorzellen fiihren, noch nicht geklart sind, haben es 
in jiingster Zeit eine Reihe von experimentellen Syste- 
men, beginnend mit teiomerischen Positionseffekten in 
Hefe (Renauld et al, 1993; Buck und Shore, 1995; Allshi- 
re et al., 1994), uber Positionseffekt- Variegation (PEV) 
in Drosophila (Reuter und Spierer, 1992), bis zur Analy- 
se von Translokationsbruchpunkten in humanen Leuka- 
mien (Solomon et al, 1991; Cleary, 1991), ermoglicht, 
einige chromosomale Proteine zu identifizieren, die an 
der deregulierten Proliferation ursachlich beteiligt sind. 

Erstens wurde festgestellt, daB die Oberexpression 
einer verkurzten Version des SIR4-Proteins zu einer 
verlangerten Lebensdauer in Hefe fuhrt (Kennedy et aL, 
1995). Da SIR-Proteine zum Entstehen multimerer 
Komplexe an den stillen "Mating Type Loci" und am 
Telomer beitragen, konnte es sein, daB tiberexprimier- 
tes SIR4 mit diesen heterochromatinartigen Komplexen 
interferiert, was schlieBlich zu einer unkontrollierten 
Proliferation fuhrt. Diese Annahme steht im Einklang 
mit der Haufigkeit des Auftretens einer deregulierten 
Telomerenlange in den meisten humanen Krebsarten 
(Counter etal, 1992). 

Zweitens wurden mittels genetischer Analysen von 
PEV in Drosophila eine Reihe von Genprodukten iden- 
tifiziert, die die Chromatinstruktur an heterochromati- 
schen Positionen und innerhalb des homeotischen Gen- 
clusters verandern (Reuter und Spierer, 1992). Mutatio- 
nen einiger dieser Gene, wie modulo (Garzino et al, 
1992) und poly homeo tic (Smouse und Perrimon, 1990), 
konnen in Drosophila die deregulierte Zeliproliferation 
oder den Zelltod verursachen. Drittens wurden Sauge- 
tierhomologe von sowohl Aktivatoren (trithorax oder 
trx-Gruppe) als auch Repressoren (z. B. polycomb oder 
Pc-Gruppe) der Chromatinstruktur von homeotischen 
Drosophila-Selektorgenen beschrieben. Unter diesen 
hat sich vom humanen HRX/ALL-1 (trz-Gruppe) ge- 
zeigt, daB es an der durch Translokation induzierten 
Leukamogenese beteiligt ist (Tkachuk et al, 1992; Gu et 
al, 1992), und daB die Oberexpression des Maus-bmi 
(Pc-Gruppe) zum Entstehen von Lymphomen fuhrt 
(Haupt et al, 1991; Brunk et al, 1991; Alkema et al, 
1995). Ein Modell fur die Funktion chromosomaler Pro- 
teine laBt darauf schlieBen, daB diese multimere Kom- 
plexe bilden, welche in Abhangigkeit von der Ausgewo- 
genheit zwischen Aktivatoren und Repressoren im 
Komplex den Kondensationsgrad der umliegenden 
Chromatinregion bestimmen (Locke et al, 1988). Eine 
Verschiebung dieses Gleichgewichts durch Oberexpres- 
sion einer der Komponenten des Komplexes zeigte eine 
Neuverteilung von eu- und heterochromatischen Regio- 
nen (Buck und Shore, 1995; Reuter und Spierer, 1992; 
Eissenberg et al, 1992). Dieser Dosiseffekt kann die 
Chromatinstruktur an vorbestimmten Loci destabiiisie- 
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ren, was letztlich zu einem Obergang vom normalen 
zum transformierten Zustand fuhrt. 

Trotz der Charakterisierung von HRX/ALL-1 und 
bmi als Protoonkogene, die die Chromatinstruktur ver- 
5 andern konnen, ist das Wissen uber Saugetiergenpro- 
dukte, welche mit Chromatin wechselwirken, noch sehr 
beschrankt. Im Gegensatz dazu wurden durch geneti- 
sche Analysen von PEV in Drosophila ca. 120 Allele fur 
Chromatinregulatoren beschrieben (Reuter und Spie- 

io rer, 1992). Kurzlich wurde eine carboxyterminale Re- 
gion mit Ahniichkeit in der Sequenz identifiziert, die 
einem positiven (trx, trx-Gruppe) und eine negativen 
(E(z), Pc-Gruppe) Drosophila-Chromatinregulator (Jo- 
nes und Gelbart, 1993) gemeinsam ist. Dariiberhinaus ist 

is dieser Carboxyterminus auch in Su(var)3— 9, einem do- 
minanten Supressor der Chromatinverteiiung in Droso- 
phila, konserviert (Tschiersch et al, 1994). 

Bei der vorliegenden Erfindung wurde von der Ober- 
legung ausgegangen, daB diese als "SET" bezeichnete 

20 Proteindomane (Tschiersch et al, 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein 
in antagonistischen Genprodukten eine neue Genfami- 
lie entwicklungsgeschichtlich wichtiger Saugetier-Chro- 
matinregulatoren definiert. Dariiberhinaus tragt die 

25 Charakterisierung weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufkla- 
rung der Mechanismen bei, die dafur verantwortlich 
sind, daB strukturelle Veranderungen im Chromatin zur 
malignen Transformation fiihren konnen. 

30 Der vorliegenden Erfindung lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu identifi- 
zieren, ihre Funktion aufzuklaren und sie fur die Dia- 
gnostik und Therapie einzusetzen. 

Zur Losung dieser Aufgabe wurde zunachst die Se- 

35 quenzinformation der SET-Domane benutzt, um aus hu- 
manen cDNA-Banken die zu den SET-Domane-Genen 
von Drosophila homologen humanen cDNAs zu erhal- 
ten. Es wurden zwei cDNAs erhalten, die Humanhomo- 
loge von E(z) bzw. Su(var)3— 9 darsteilen; die entspre- 

40 chenden humanen Gene wurden als HEZ-2 und H3— 9 
bezeichnet (vgl. unten); auBerdem wurde eine variante 
Form von HEZ-2 identifiziert, die als HEZ-1 bezeichnet 
wurde. 

Die vorliegende Erfindung betrifft somit DNA-Mole- 

45 kule, enthaltend eine fur ein Chromatinregulator-Prote- 
in, das eine SET-Domane aufweist, kodierende Sequenz 
oder eine Teilsequenz davon, dadurch gekennzeichnet, 
daB sie die in Fig. 6 oder in Fig. 7 dargestellte Nukleo- 
tidsequenz aufweisen. Die erfindungsgemaBen DNA- 

50 Molekiile werden im folgenden auch als "erfindungsge- 
maBe Gene" bezeichnet 

Die erfindungsgemaBen Gene tragen die Bezeich- 
nung HEZ-2 und H3-9. 

Die Erfindung betrifft in einem weiteren Aspekt die 

55 von diesen Genen abgeleiteten cDNAs, einschlieBlich 
ihrer degenerierten Varianten; Mutanten, die fur funk- 
tionelle Chromatinregulatoren kodieren sowie Varian- 
ten, die auf eine Genduplikation zuruckzufiihren sind; 
ein Beispiel dafur ist HEZ-1, dessen Sequenz im Ver- 

60 gleich mit HEZ-2 in Fig. 8 dargestellt ist 

Zur Losung der im Rahmen der vorliegenden Erfin- 
dung gestellten Aufgabe wurde im einzelnen wie folgt 
vorgegangen: Ausgehend von der Sequenzinformation 
von der konservierten SET-Domane, wurde unter redu- 

65 zierter Stringenz eine humane B-Zell-spezifische 
cDNA-Bibliothek mit einer gemischten Drosophila- 
DNA-Sonde, die fur die SET-Domanen von E(z) und 
Su(var)3— 9 kodiert, gescreent Aus 500.000 Plaques 
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wurden 40 prim&re Phagen ausgewahlt Nach zwei wei- 
teren Runden Screening zeigte sich, daB 31 Phagen fur 
authentische E(z)-Sequenzen kodieren und daB funf 
Phagen E(z)-Varianten darstellen. Im Gegensatz dazu 
hybridisierten nur zwei Phagen mit der Sonde, die die 
SET-Domane von Su(var)3— 9 allein enthielt. Die Pha- 
geninserts wurden mitteis Polymerasekettenreaktion 
(PCR) amplifiziert und mitteis Restriktionskartierung 
und Teiisequenzierung analysiert Representative 
cDNA- Inserts wurden 

subkloniert und iiber ihre ganze Lange sequenziert Die 
5^-Enden wurden isoliert, indem positive Phagen noch 
einmal mit 5'-DNA-Sonden gescreent wurden, worauf 
nach Subklonierung komplette cDNAs erhaiten wur- 
den. 

Die komplette, fur das humane Homologe von E(z) 
kodierende cDNA wurde als HEZ-2 und die DNA, die 
fur das humane Homologe von Su(var)3— 9 kodiert, 
wurde als H3— 9 bezeichnet Insgesamt betr&gt die 
Identity der Aminosauren zwischen Drosophila und 
den humanen Proteinen 61% fur HEZ-2 und 43% fiir 
H3— 9, wobei die C-terminale SET-Domane sehr hoch 
konserviert ist (88% fiir HEZ-2 und 53% fur H3-9). 
Der Sequenzvergleich zeigte weitere deutiiche Horno- 
logieregionen, z. B. eine Cystein-reiche Domane in 
HEZ-2 und eine Chromo-Box in H3— 9. (In polycomb 
wurde gezeigt, daB die Chromo-Box die fur die Wech- 
selwirkung zwischen DNA und Chromatin wesentliche 
Domane ist; Messmer et al., 1992). Im Gegensatz dazu 
fehlen die 207 Aminosauren, die das aminoterminale 
GTP-Bindungsmotiv des Drosophila-Proteins enthal- 
ten, im putativen humanen Homoiogen H3— 9. 

Der Vergleich der Aminos&ure-Sequenzen zwischen 
den Drosophila- und den humanen Genen ist in den 
Fig, 1 und2dargestellt: 

Fig. 1 zeigt den Vergleich der Aminos&ure-Sequenz 
zwischen HEZ-2 und von Drosophila-enhancer von ze- 
ste (E(z)). Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und 
der Cys-reichen Region (Cys-Reste sind hervorgeho- 
ben) sind gezeigt. Die mutmaBlichen Kernlokalisie- 
rungssignale sind unterstrichen. 

Fig. 2 zeigt den Vergleich der Aminosiiure-Sequenz 
zwischen dem humanen Homoiogen H3— 9 und Droso- 
phiIa-Su(var)3— 9. Identische Aminosauren der konser- 
vierten carboxyterminalen SET-Domane (schattierte 
Box) und der Chromo-Domane (dunkler schattierte 
Box) sind dargestellt Die mutmaBlichen Kernlokalisie- 
rungssignale sind unterstrichen. Oben in der Figur ist 
eine schematische Obersicht der beiden Proteinstruktu- 
ren dargestellt, die zeigt, daB im humanen Homoiogen 
207 Aminosauren am N-Terminus fehlen. 

Da translationale Consensussequenzen in Umgebung 
des Start- ATG der humanen H3— 9-cDNA auch an der 
entsprechenden internen Position in Su(var)3— 9 vor- 
handen sind, diirfte das Drosophila-Protein zusatzliche 
Exons enthalten, die in einem spateren Stadium der 
Evolution fiir die Funktion entbehrlich wurden. (Die 
Richtigkeit dieser Hypothese kann bestatigt werden, in- 
dem die humane H3— 9-cDNA und komplette oder am 
5'-Ende verkurzte cDNAs von Su(var)3-9 in Drosophi- 
la exprimiert werden. Es wurde eine weitere cDNA der 
Bezeichnung MG-44 beschrieben (s. unten), der eben- 
fallsdasS'-Endefehlt) 

Im Rahmen der vorliegenden Erfindung durchgefOhr- 
te DNA-Blot-Analysen deuten darauf hin, daB HEZ und 
H3—9 in der Maus von einzelnen Genen repr&sentiert 
werden, w&hrend im Menschen HEZ-Sequenzen durch 



zwei getrennte Loci kodiert werden. Der zweite HEZ- 
Locus (als HEZ-1 bezeichnet) wurde auch durch Cha- 
rakterisierung einer kleinen Anzahl von cDNA-Varian- 
ten, die sich in ihren 3'-flankierenden Sequenzen von der 
5 Mehrzahl der aus der humanen cDNA-Bibliothek iso- 
lierten HEZ-Klone unterscheiden, bestatigt. Die Unter- 
schiede zwischen HEZ-2 und HEZ-1 im sequenzierten 
Bereich sind in Fig. 8 dargestellt: Die SET-Domane von 
HEZ-1 zeigt gegenuber HEZ-2 Mutationen; auBerdem 
io hat HEZ-1 in der SET- Domane ein Stopoodon, das das 
Protein um die 47 C-terminalen Aminosauren verkurzt. 
In Fig. 8 ist die Nukleotidsequenz der HEZ-2-cDNA 
von Position 1844 bis 2330 in der jeweils oberen Zeile 
dargestellt, wobei das authentische Stopcodon unter- 
15 strichen ist Um eine Teilsequenz der cDNA der HEZ- 
1-Variante der HEZ-2-Sequenz zuzuordnen, wurde das 
gap-Programm des Wisconsin GCG Netzwerkservice 
verwendet Das vorzeitige Stopcodon in HEZ-1 (Posi- 
tion 353) ist unterstrichen. Sequenzen, die fur die kon- 
20 servierte SET-Domane kodieren, sind hervorgehoben. 
AuBerdem ist das 3'-Ende (Position 151 in HEZ-1) des 
aberranten Transkripts B52 (s. unten) dargestellt. Uber 
die verfiigbare Sequenz zeigte sich B52 zu 97% iden- 
tisch mit HEZ-1 und zu 72% identisch mit HEZ-2. Der 
25 Sequenzvergleich von HEZ- 1 mit HEZ-2 sowie die Fest- 
stellung, daB beim Menschen im Gegensatz zur Maus 
zwei getrennte HEZ-Loci auftreten, lassen darauf 
schlieBen, daB beim Menschen eine Genduplikation auf- 
getreten sein diirfte. 
30 In einem Vergleich mit cDNA-Sequenzen in der Da- 
tenbank GeneBank wurde uberraschend festgestellt, 
daB bestimmte in der Datenbank eingetragene cDNA- 
Teilsequenzen, die von aberranten Transkripten in Tu- 
morgeweben abgeleitet sind, mutierte Versionen der er- 
35 findungsgemaBen cDNAs darstellen: 

Einerseits war auf der Suche nach BRCA1, einem 
Gen, das fur Brust- und Eileiterkrebs pradisponiert, eine 
partielle cDNA-Sequenz mit 271 Nukleotiden der Be- 
zeichnung B52, die fur eine mutierte Variante der SET- 
40 Domane kodiert, isoliert und auf dem humanen Chro- 
mosom 17q21 kartiert worden (Friedman et al., 1994). Es 
wurde im Rahmen der vorliegenden Erfindung uberra- 
schend festgestellt, daB B52 97% Identity mit der erfin- 
dungsgemaBen HEZ- 1-cDN A- Variante aufweist (vgl. 
45 oben); moglicherweise stellt HEZ-1 ein Pseudogen dar, 
dessen Reaktivierung bei der deregulierten Prolifera- 
tion eine Rolle spielt 

Andererseits war eine cDNA (2.800 Nucleotide; MG- 
44) vom humanen Chromosom Xpll isoliert worden 
so (Geraghty et al., 1993), einer Region, die fiir degenerati- 
ve Storungen der Netzhaut und Synovialsarkome pra- 
disponiert. Es wurde uberraschend festgestellt, daB die- 
se cDNA 98% Identitat mit der erfmdungsgemaBen 
H3— 9-cDNA aufweist. (Der Sequenzvergleich der 
55 H3— 9-cDNA mit ihrer mutierten Version MG-44 zeigt, 
daB diese ebenfails nicht das am 5'-Ende gelegene GTP- 
Bindungsmotiv des Drosophila- Homoiogen aufweist.) 

Die im Rahmen der vorliegenden Erfindung bereitge- 
stellten neuen Gene ermdglichen es somit erstmals, ei- 
60 nen Zusammenhang zwischen bestimmten Krebser- 
krankungen und Mutationen in Chromatinregulatoren 
herzuleiten; im Falle der MG-44-cDNA konnte, da diese 
mehrere Punkt- und Frameshift- Mutationen aufweist, 
welche die Chromo- und SET-Domanen unterbrechen, 
65 erst anhand der erfindungsgemaBen H3-9-cDNA ein 
Zusammenhang zwischen Su(var)3~9 und MG-44 auf- 
gekiart werden. 

Neben den bereits genannten Sequenzen sind in der 
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Sequenzdatenbank GeneBank als weitere humane Mit- 
glieder der SET-Proteinfamilie das gut dokumentierte 
humane Homologe von Drosophila trx, HRX/ALL-1 
(Tkachuk et al„ 1992; Gu et al„ 1992) eingetragen, ferner 
ein Gen unbekannter Funktion der Bezeichnung G9a, 
das im humanen Major Histocompatibility Complex 
(Milner und Campbell, 1993) vorhanden ist drittens eine 
nicht publizierte cDNA (KG-1), die aus unreifen myeloi- 
den Tumorzeilen isoliert wurde (Nomura et ah, 1994). 
Wahrend G9a derzeit das einzige humane Gen mit einer 
SET-Domane ist, fur das bisher keine mutierte Version 
bekannt ist, tragt KG-1 eine Insertion von 342 Amino- 
sauren, welche die SET-Domane in eine Amino- und 
eine Carboxyterminale Halfte spaltet Ob diese KG- 
1-cDNA das authentische Gen oder eine aberrante Ver- 
sion darstellt, ist unklar. Insgesamt sind vier der fiinf 
derzeit bekannten humanen Mitglieder der SET-Pro- 
teinfamilie Anderungen unterworfen, die alle die SET- 
Domane mutieren (HRX/ALL-1, HEZ-1/B52, MG-44 
und KG-1). Daniberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Translokationsbruchpunkten oder instabilen chromoso- 
malen Regionen kartiert (HRX/ALL-1, HEZ-1/BS2 und 
MG-44). In Fig. 3 sind die aberranten Transkripte von 
humanen SET-Domane-Genen dargestellt. Links in der 
Figur ist die Lage der fiinf derzeit bekannten SET-Do- 
mane-Gene auf dem jeweiligen Chromosom angegeben. 
U.a. sind die drei Gene (HRX/ALL-1, HEZ-1/B52 und 
MG-44), fur die aberrante cDNAs auf Translokations- 
bruchpunkten oder instabilen Chromatinregionen kar- 
tiert wurden, dargestellt Vier der fiinf dargestellten 
SET-Domane-Gene weisen Mutationen auf, die alle die 
Carboxyterminale SET-Domane unterbrechen, welche 
in der Figur durch die dunkle Box dargestellt ist Eine 
Translokation verbindet die aminoterminale Halfte von 
HRX mit einer nicht korrelierten Gensequenz, die als 
gepunktete Box mit der Bezeichnung ENL dargestellt 
ist. Ein vorzeitiges Stopcodon verkiirzt die SET-Doma- 
ne von HEZ-1/B52. Punkt- und Frameshift-Mutationen 
unterbrechen die Chromo- und SET-Domane in MG-44. 
Eine groBe Insertion spaltet die SET-Domane von 
KG-1 in zwei Half ten. Aberrante Transkripte sind der- 
zeit fur G9a nicht bekannt. Das Cystein-reiche Cluster in 
B52 ist als gepunktete Box dargestellt; in HRX/ALL-1 
sind die Homologieregion zu Methyltransferasen als 
schraffierte Box und die A/T-Haken als vertikale Linien 
dargestellt Die Namen der jeweiligen authentischen 
Gene sind rechts in der Figur angegeben. 

Die Tatsache, daB ein Saugetiergen der SET-Protein- 
familie, HRX/ALL-1, mit translokationsinduzierter Leu- 
kamogenese im Zusammenhang gebracht wurde (Tka- 
chuk et al., 1992; Gu et aL, 1992), ist ein starker Hinweis 
dafur, daB Proteine mit SET-Domane nicht nur wichtige 
Reguiatoren der Entwicklung sind, die chromatinabhan- 
gige Veranderungen der Genexpression mitbestimmen, 
sondern daB sie, nach Mutation, auch die normale Zell- 
proliferation storen. 

Da alle bisher beschriebenen Mutationen die Primar- 
struktur der SET-Domane unterbrechen, liegt die Ver- 
mutung nahe, daB es die SET-Domane als solche ist die 
eine entscheidende Rolle im Obergang vom normalen 
zum transformierten Zustand spielt Eine wichtige 
Funktion fur die SET-Domane kann ferner aufgrund 
ihrer evolutionaren Konservierung in Genprodukten, 
die von der Hefe bis zum Menschen auf treten, vermutet 
werden. 

Fig. 4 zeigt die evolutionare Konservierung von SET- 
Domane-Proteinen: Unter Verwendung des tfasta-Pro- 
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gramms des Wisconsin GCG Netzwerkservice wurden 
Proteine und offene Leserahmen mit Homologie zur 
SET-Domane identifiziert In der Figur ist eine repra- 
sentative Auswahl von Hefe bis zum Menschen gezeigt. 
5 Ziffern geben Aminosauren an. Die Carboxyterminale 
SET-Domane ist durch eine schwarze Box dargestellt, 
Cys-reiche Regionen durch eine dunkei gepunktete Box, 
das GTP-Bindungsmotiv in Su(var)3— 9 durch eine hell- 
gepunktete Box und die Chromo-Domane von 

io Su(var)3— 9 und H3-9 durch eine offene Box mit hellen 
Punkten. Eine Region mit Homologie zu Methyltransfe- 
rase (trx und HRX) ist als schraffierte Box dargestellt 
A/T-"Haken" ("A/T Hooks") sind durch vertikale Linien 
dargestellt. Eine weitere Ser-reiche Region (S in 

15 C26E6.10) und eine Giu-reiche Region (E in G9a) oder 
Ankyrin-Repeats (ANK in G9a) sind ebenfalls hervor- 
gehoben. YHR119 (GeneBank Accession No. U00059) 
und C26E6.10 (GeneBank Accession No. U13875) sind 
offene Leserahmen von kurzlich in die Datenbank ein- 

20 getragenen Cosmiden ohne eine funktionelle Charakte- 
risierung. Prozente geben die Gesamtheit der Amino- 
saure-Identitaten zwischen den humanen und den Dro- 
sophila-Proteinen an. 
Fig. 5 zeigt die Obereinstimmung an Aminosauren 

25 der SET-Domane. Die SET-Domane der in Fig. 4 darge- 
stellten Gene wurde unter Verwendung des Pileup-Pro- 
gramms des Wisconsin GCG Netzwerkservice ange- 
ordnet Fur den Vergleich der KG-1 -SET-Domane wur- 
de vor dem Pileup die groBe Aminosaure-Insertion, die 

30 die SET-Domane in zwei Haiften spaltet, entfernt. Ami- 
nosaure-Positionen, die 8 von 10 Obereinstimmungen 
aufweisen, sind hervorgehoben. 

Aufgrund der im Rahmen der vorliegenden Erfindung 
festgestellten Kriterien erweist sich eine Beteiligung der 

35 Gene, die eine SET-Domane haben, an der chromatin- 
abhangigen Entstehung der deregulierten Proliferation; 
diese Gene bzw. die davon abgeleiteten cDNAs sowie 
Teil- und mutierte Sequenzen konnen somit bei der 
Therapie und Diagnose von Erkrankungen, die auf eine 

40 derartige Proliferation zuruckzufuhren sind, eingesetzt 
werden: 

Unterschiede im Transkriptionsniveau von SET-Do- 
mane-RNAs zwischen normalen und transformierten 
Zeilen konnen als diagnostischer Parameter fur Erkran- 

45 kungen herangezogen werden, in denen die Expression 
von SET-Domane-Genen dereguliert ist: 

So konnen Oligonukleotide, kodierend fur die SET- 
Domane als solche bzw. Teilabschnitte davon, als dia- 
gnostischer Marker verwendet werden, um bestimmte 

50 Krebsarten, in denen die SET-Domane mutiert ist zu 
diagnostizieren. Fur die detaillierte Analyse der Funk- 
tion der erfindungsgemaBen cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Einsatz von 
SET-Domane-Gensequenzen wurden im Rahmen der 

55 vorliegenden Erfindung die homologen Maus-cDNAs 
von HEZ-2 und H3— 9 isoliert Bei Verwendung der 
Maus-HEZ-cDNA als spezifische DNA-Sonde in "nu- 
clease SI protection" Analysen zur Untersuchung der 
HEZ-2-Genaktivitat wahrend der normalen Mausent- 

60 wicklung zeigte sich ein eher breites Expressionsprofil, 
das ahnlich dem von bmi (Haupt et al., 1991) ist Die mit 
den Maussequenzen durchgefiihrten Analysen werden 
mit Humansequenzen ausgeweitet, um die RNA-Men- 
gen zwischen unreifen Voriauferzellen, Tumorzeilen 

65 und differenzierten Zeilen in verschiedenen humanen 
Zellkultursystemen zu vergleichen. Um festzustellen, ob 
sich die SET-Domane dementsprechend als diagnosti- 
scher Tumormarker fur spezifische Krebserkrankungen 
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oder als genereller diagnostischer Parameter eignet, 
kdnnen gangige Methoden zur Bestimmung der RNA- 
Konzentration, die in einschlagigen Laborhandbiichern 
(Sambrook, J., Fritsch, E.F. und Maniatis, T„ 1989, Cold 
Spring Harbor Laboratory Press) beschrieben sind, wie 
Northern Blot, Sl-Nuclease-Protection-Analyse oder 
RNAse- Protection- Analyse, verwendet werden. 

Um die H&ufigkeit zu untersuchen, mit der die SET- 
Dom&ne spezifischen Mutationen unterliegt, kdnnen die 
SET-spezifischen DNA-Sonden zur Analyse von Einzel- 
strang-Konformationspolymorphismen (single strand 
conformation polymorphisms; SSCP; Gibbons et aL, 
1995) eingesetzt werden. 

Krebsarten, bei denen SET-spezifische DNA-Sonden 
als diagnostischer Marker verwendet werden kdnnen, 
sind Brustkrebs (HEZ-2; Friedman et al, 1994), Synovi- 
alksarkom (H3— 9; Geraghty et al; 1993) und Leuka- 
mien. 

Aufgrund der Kenntnis der Nukieotidsequenz der 



sche Funktion hat, ahnlich der aminoterminalen BTB- 
Domane verschiedener Chromatinregulatoren, ein- 
schlieSlich des GAGA-Faktors (Adams et al, 1992). Ins- 
gesamt erlauben die Analysen von Wechselwirkungen 
5 mit Epitop-versehenen HEZ-2- und H3— 9-Proteinen 
eine weitere Charakterisierung der Funktion der SET- 
Domlne. Dadurch werden Moglichkeiten erdffnet, ge- 
gen die dereguiierte Aktivit&t vorzugehen, indem z. B. 
mittels gentherapeutischer Methoden dominant-negati- 
io ve Varianten der SET-Domane-cDNA-Sequenzen in 
die Zelle eingefiihrt werden. Derartige Varianten wer- 
den z. B. erhalten, indem zunachst die funktionellen Do- 
mlnen der SET-Proteine definiert werden, z. B. die fur 
die DNA/Chromatin- oder die fur die Protein/Protein- 
15 Wechselwirkung verantwortlichen Sequenzabschnitte, 
und indem dann die um die jeweiiige(n) Domane(n) oder 
um Abschnitte davon verkiirzten DNA-Sequenzen in 
der betroffenen Zelle zur Expression gebracht werden, 
um eine durch das intakte funktionelle Protein verur- 



SET-Domane-Gene kdnnen die entsprechenden von 20 sachte Deregulation der Proliferation zu kompetitieren. 



der cDNA-Sequenz abgeleiteten Proteine, die ebenfalls 
Gegenstand der vorliegenden Erfindung sind, in rekom- 
binanter Form herstellt werden, indem die dafiir kodie- 
renden cDNAs in geeignete Vektoren inseriert und in 
Wirtsorganismen exprimiert werden. Die fur die Pro- 
duktion rekombinanter Proteine verwendeten Techni- 
ken sind dem Durchschnittsfachmann gel&ufig und kdn- 
nen einschlagigen Handbiichern (Sambrook, J., Fritsch, 
E.F. und Maniatis, 1989, Cold Spring Harbor Labora- 
tory Press) entnommen werden. 

Gegenstand der vorliegenden Erfindung sind somit in 
einem weiteren Aspekt rekombinante DNA-Molekiile, 
enthaltend die fOr HEZ-2, H3— 9 oder HEZ-1 kodieren- 
de DNA sowie damit funktionell verbundene Expres- 
sionskontrollsequenzen, sowie die damit transformier- 
ten Wirtsorganismen. 

Die erfindungsgem&Ben rekombinanten Proteine 
kdnnen eingesetzt werden, um die Wechselwirkung von 
SET-Dom&ne-Proteinen mit Chromatin bzw. mit ande- 



Die Verfiigbarkeit der erfindungsgemaBen cDNAs 
erlaubt ferner die Herstellung transgener Tiere, z. B. 
Mause, in denen SET-Dom£ne-Gene entweder iiberex- 
primiert werden kdnnen ("gain-of-function") oder in de- 
25 nen diese Gene ausgeschaltet werden kdnnen ("loss-of- 
function"); fiir letztere Analysen werden die korrespon- 
dierenden Tiersequenzen, insbesondere Maussequen- 
zen, der erfindungsgemaBen Gene eingesetzt. 

Insbesondere gibt die "gain-of -function"- Analyse, bei 
30 der Allele der erfindungsgemaBen Gene in die Maus 
eingefiihrt werden, letztlich AufschluB iiber die urs&chli- 
che Beteiligung von HEZ-2 und H3— 9 an der chroma- 
tinabhangigen Fdrderung der Tumorentstehung. Fur 
die "gain-of-function"-Analyse kdnnen die kompletten 
35 cDNA-Sequenzen von humanem HEZ-2 und H3— 9 so- 
wie deren mutierte Versionen, wie HEZ-1/B52 und MG- 
44, mittels Vektoren, die hohe Expressionsraten ermdg- 
lichen, z. B. Plasmiden mit dem humanen p-Actin-Pro- 



motor, getrieben sowohl vom Enhancer der schweren 

ren Mitgliedern von Heterochromatinkomplexen zu 40 Kette von Immunglobulinen (Eu) als auch von Moloney- 

anaiysieren; ausgehend von den dabei erhaltenen Er- Virus- Enhancern (Mo-LTR). Kurzlich wurde gezeigt, 

kenntnissen iiber die Wirkungsweise dieser Komplexe daB die Eu/Mo-LTR-abMngige Uberexpression des 

werden die sich im einzelnen ergebenden Mdglichkeiten bmi-Gens, welches gemeinsam mit HEZ-2 zur Pc-Grup- 

fiir das gezielte Eingreifen in die daran beteiligten Me- pe negativer Chromatinregulatoren zahlt, ausreicht in 

chanismen definiert und kdnnen fiir therapeutische An- 45 transgenen M&usen Lymphome zu erzeugen (Alkema et 

wendungen genutzt werden. al., 1995). 

Untersuchungen, die der weiteren Analyse der Funk- Indem in 3, loss-of-function M - Analysen die endogenen 

tion der SET-DomMne dienen, werden z. B. durchge- Maus-Loci fiir HEZ-2 und H3— 9 durch homologe Re- 

fiihrt, indem cDNAs, kodierend fiir humanes HEZ-2 kombination in embryonalen Stammzellen unterbro- 

bzw. H3— 9 und versehen mit einem Epitop, gegen das 50 chen werden, kann bestimmt werden, ob der Verlust der 

Antikdrper zur VerfOgung stehen, in vitro sowie in Ge- in vivo-Genfunktion zu einer abnormalen Entwicklung 

webekulturen exprimiert werden. Nach Immunprtzipi- der Maus fuhrt. 

tation mit den jeweiligen epitopspezifischen Antikdr- Aufgrund dieser in vivo-Systeme kann die Wirkung 

pern kann festgestellt werden, ob HEZ-2 und H3— 9 von HEZ-2 und H3— 9 bestatigt werden; diese Systeme 

miteinander in vitro wechselwirken kdnnen und ob in 55 dienen aufierdem als Grundlage fiir Tiermodelle im Hin- 



vivo eine Komplexbildung zwischen HEZ-2 und/oder 
H3— 9 mit weiteren Chromatinregulatoren stattfindet. 

Es wurde bereits von anderen Autoren angenommen 
(DeCamiilis et aL, 1992; Rastelli et ah, 1993; Orlando und 
Paro, 1993), dafi eine Komplexbildung zwischen ver- 
schiedenen Mitgliedern von Heterochromatinproteinen 
wesentlich far deren Funktion ist Aufgrund der Verfiig- 
barkeit der erfindungsgemaBen SET-Domane-Gene 
kann festgestellt werden, ob die SET-Region eine Do- 
m&ne darstellt, die aufgrund von Wechselwirkungen 
funktioniert, oder ob sie zum Entstehen multimerer he- 
terochromatischer Komplexe beitrlgt Ebenso kann 
festgestellt werden, ob die SET-Domane eine inhibitori- 



60 



65 



blick auf eine humane Gentherapie. 

Der gentherapeutische Einsatz der erfindungsgema- 
Ben DNA-Sequenzen oder davon abgeleiteter Sequen- 
zen (z. B. komplement^rer Antisenseoligonukleotide) 
erfolgt — je nachdem, ob die zu behandelnde Erkran- 
kung auf eine Deregulation von Chromatin infolge des 
Fehlens der funktionellen Gensequenz, oder aber infol- 
ge einer Oberexpression der entsprechenden Gene oder 
durch Reaktivierung eines Pseudogens zuruckzufiihren 
ist — durch Einfuhrung der funktionellen Gensequenz, 
durch Inhibierung der Genexpression, z. B. mit Hilfe von 
Antisenseoligonukleotiden, oder durch Einfiihrung ei- 
ner fiir eine dominant-negative Mutante kodierenden 
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Sequenz. Die Einfuhrung der jeweiligen DNA-Sequen- 
zen in die Zelle kann mit Hilfe von Standardmethoden 
fur die Transfektion hoherer eukaryotischer Zellen er- 
folgen, zu denen der Gentransfer mittels viraler Vekto- 
ren (Retrovirus, Adenovirus, Adeno-assoziiertes Virus) 
oder mittels nicht-viralen Systemen auf Basis der Re- 
zeptor-vermittelten Endozytose zahlen; Obersichten 
uber gebrauchliche Methoden werden z. B. von Mitani 
und Caskey, 1993; Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zatloukal et aL, 1993, 
WO 93/07283 gegeben. 

Fur eine Inhibierung der Expression der erfindungs- 
gemaBen Gene kommen auch niedermolekulare Sub- 
stanzen in Betracht, die in die Transkriptionsmaschine- 
rie eingreifen; nach Analyse der 5'-regulatorischen Re- 
gion der Gene kann nach Substanzen gescreent werden, 
die die Wechselwirkung der jeweiligen Transkriptions- 
faktoren mit dieser Region ganz oder teilweise blockie- 
ren, z. B. mit Hilfe der in der Wo 92/13092 beschriebe- 
nen Methode. 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechen- 
den Antikorper gegen das HEZ-2- oder H3— 9-Protein, 
vorzugsweise humane oder humanisierte Antikorper, 
therapeutisch eingesetzt werden. Die Herstellung sol- 
dier Antikdrper erfolgt nach bekannten Methoden, wie 
sie z. B. von Malavsi und Albertini, 1992, oder von Rhein, 
1993, beschrieben wurden. 

Antikorper gegen HEZ-2 oder H3— 9, die therapeu- 
tisch oder diagnostisch verwendet werden konnen, sind 
ebenf alls Gegenstand der vorliegenden Erf indung. 

Figurenubersicht 

Fig. 1 Aminosaure-Sequenzvergleich zwischen 
HEZ-2 und E(z), 

Fig. 2 Aminosaure-Sequenzvergleich zwischen 
H3 — 9 und Su(var)3 — 9, 

Fig. 3 Aberrante Transkripte von humanen SET-Do- 
mane-Genen, 

Fig. 4 Evolutionare Konservierung von SET-Doma- 
ne-Proteinen, 

Fig. 5 Aminosaure-Obereinstimmung in der SET- Do- 
mane, 

Fig. 6 DNA-Sequenz von HEZ-2, 
Fig. 7 DNA-Sequenz von H3-9, 
Fig. 8 Sequenzvergleich zwischen den cDNAs von 
humanem HEZ-2 und REZ-1. 

Beispiel 

a) Herstellung einer cDNA-Bibliothek 

Es wurde eine humane B-Zell-spezifische cDNA-Bi- 
bliothek, wie von Bardwell und Treisman, 1994, be- 
schrieben, hergesteilt, indem PolyfA^-RNA aus huma- 
nen BJA-B-Zellen isoliert, mittels Poly(dT)i5-Priming re- 
vers transkribiert und in doppelstrangige cDNA kon- 
vertiert wurde. Nach Zugabe eines EcoRI-Adapters der 
Sequenz 5' AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI-Stelle des Bakteriophagen XgtlO 
ligiert. Die Propagierung und Amplifizierung der Bi- 
bliothek erfolgte in E.coli C600. 

b) Herstellung von DNA-Sonden 65 

Drosophila-DNA-Sonden, kodierend fiir die konser- 
vierten SET-Domanen von E(z) und Su(var)3— 9, wur- 
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den auf der Grundlage der publizierten Drosophila-Se- 
quenzen (Jones und Gelbart, 1993; Tschiersch et al, 
1994) mittels Poiymerasekettenreaktion (PCR) herge- 
steilt: 1 jig von Drosophila melanogaster-DNA (Clon- 
5 tech) wurde mit den beiden Primern E(z) 1910 (5' ACT- 
GAATTCGGCTGGGGCATCTTTCTTAAGG) und E( 
z) 2280 (5' ACTCTAGACAATTTCCATTT- 
CACGCTCTATG) einer PcR-Amplifikation (35 Zyklen 
zu 30 sek bei 94° C, 30 sek bei 55° C und 30 sek bei 72° C) 
io unterworfen. Die entsprechende SET-Domane-Sonde 
fur Su(var)3— 9 wurde von 10 ng Plasmid-DNA 
(Tschiersch et al, 1994; Klon M4) mit dem Primerpaar 
suvar.up (5' ATATAGTACTTCAAGTCCATTCAA- 
AAGAGG) und suvar.dn (5' 

15 CCAGGTACCGTTGGTGCTGTTTAAGACCG) am- 
plifiziert, wobei dieselben Zyklusbedingungen verwen- 
det wurden. Die erhaltenen SET-Domane-DNA-Frag- 
mente wurden Gel-gereinigt und teilsequenziert, um die 
Richtigkeit der ampiif izierten Sequenzen zu bestatigen. 

20 

c) Screenen der cDNA-Bibliothek 

5 x 10 5 Plaque-bildende Einheiten ("plaque forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 
25 Wirtsstammes E.coli C600 (bei einer optischen Dichte 
ODgoo von 0.5 in 10 mM MgSC>4 suspendiert) bei 37° C 
15 min lang inkubiert und dann auf eine groBe (200 mm 
x 200 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum uber Nacht bei 37° C wurden die Phagen auf 
30 einer Nylonmembran (GeneScreen) absorbiert Die 
Membran wurde, die Seite mit den absorbierten Phagen 
nach oben schauend, 30 sek lang in Denaturierungslo- 
sung (1.5 M NaCl, 0.5 M NaOH) schwimmen gelassen, 
dann 60 sek in Denaturierungslosung eingetaucht und 
35 abschlieBend 5 min lang in 3 M NaCl, 0.5 M Tris pH 8, 
neutralisiert. Dann wurde die Membran kurz in 3 x SSC 
gespult und die Phagen-DNA mittels UV-Vernetzung 
auf das Nylonfilter fixiert Das Filter wurde 30 min lang 
bei 50° C in 30 ml Church-Puffer (1% BSA, 1 mM EDTA 
40 und 0.5 M NaHP0 4 , pH 7.2) prahybridisiert, anschlie- 
Bend wurden 2 x 10 6 cpm der radioaktiv markierten 
DNA-Sondenmischung (E(z)-SET und 

Su(var)3-9-SET) zugegeben; die DNA-Sonden wurden 
durch Random-priming unter Verwendung des RediPri- 
45 me-Kit (Amersham) hergesteilt. Die Hybridisierung 
wurde uber Nacht bei 50° C durchgefiihrt Nach Entfer- 
nung der Hybridisierungslosung wurde das Filter 10 sek 
in 2xSSC, 1% SDS bei Raumtemperatur gewaschen, 
anschlieBend wurde 10 sek lang bei 50° C gewaschen. 
so Das Filter wurde in Saranwrap gewickeit und unter 
Verwendung einer Verstarkerfolie der Autoradiogra- 
phic unterworfen. 

Positive Phagenkolonien wurden auf der Original- 
platte mittels Zuordnung des Autoradiogramms identi- 
55 fiziert und die entsprechenden Agarstuckchen mit dem 
groBeren Ende einer Pasteur- Pipette entfernt. Der Pha- 
gen-Pool wurde uber Nacht bei 4°C in 1 ml SM- Puffer 
(5,8 g NaCl, 2 g MgS0 4 -H 2 0, 50 ml Tris pH 75, 5 ml 
2%ige Gelatine auf 1 1 H 2 0), enthaltend einige Tropfen 
60 CHC1 3 , eluiert. Das Phageniysat wurde fiir eine zweite 
und dritte Screeningrunde wieder ausplattiert um ein- 
zelne, gut isolierte positive Plaques (20 bis 100 Plaques 
pro Platte in der dritten Runde) zu erhalten. 

d) Sequenzanalyse 

Die cDNA-Inserts von rekombinanten Phagen wur- 
den in den Polylinker von pBluescript KS (Stratagene) 
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subkloniert und auf einem automatischen Sequenzer 
(Applied Biosystems) unter Verwendung der Didesoxy- 
Methode sequenziert Die komplette Sequenz von we- 
nigstens zwei unabhangigen Isolaten pro erhaltenen 
Gen wurde mittels "Primer walking" ermittelt Die Se- 5 
quenzen wurden mit dem GCG-Software-Paket (Uni- 
versity of Wisconsin) analysiert, die Untersuchung auf 
Homologie wurde mit dem "Blast and fasta" oder "tfa- 
sta" Netzwerkservice durchgefiihrt Die kompletten Se- 
quenzen von HEZ-2 und H3— 9 sind in Fig. 6 und 7 10 
dargestellt 
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Patentanspriiche 

1. DNA-Molekiile, enthaltend eine fur ein Chro- 
matinregulator-Protein, das eine SET-Domane auf- 
weist, kodierende Sequenz oder eine Teilsequenz 65 
davon, dadurch gekennzeichnet, daB sie die in 
Fig. 6, Fig, 7 oder Fig. 8 dargestellte Nukleotidse- 
quenz, kodierend fiir HEZ-2, H3— 9 oder HEZ-1, 



einschiieBIich ihrer degenerierten Varianten sowie 
Mutanten davon, enthalten. 

2. DNA-Molekiil nach Anspruch 1, dadurch ge- 
kennzeichnet, daB es eine cDNA ist 

3. DNA-Molekiil nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, daB es humanen Ursprungs ist. 

4. cDN A nach Anspruch 3 der Bezeichnung HEZ-2. 

5. cDNA nach Anspruch 3 der Bezeichnung H3— 9. 

6. DNA-Molekiil nach Anspruch 4, dadurch ge- 
kennzeichnet, daB es die fur die SET-Domane von 
HEZ-2 kodierende Region oder einen Abschnitt 
davon enthalt 

7. DNA-Molekiil nach Anspruch 5, dadurch ge- 
kennzeichnet, daB es die fiir die SET-Domane 
H3— 9 kodierende Region oder einen Abschnitt da- 
von enthalt 

8. DNA-Molekiil nach Anspruch 4, dadurch daB es 
fiir eine dominant-negative Mutante von HEZ-2 
kodiert. 

9. DNA-Molekiil nach Anspruch 4, dadurch daB es 
fiir eine dominant-negative Mutante von H3— 9 ko- 
diert 

10. Rekombinantes DNA-Molekiil, enthaltend eine 
in Anspruch 2 definierte cDNA, funktionell verbun- 
den mit Expressionskontrollsequenzen, zur Expres- 
sion in prokaryotischen oder eukaryotischen Wirts- 
organismen. 

11. Prokaryotische oder eukaryotische Wirtsorga- 
nismen, transformiert mit rekombinanter DNA 
nach Anspruch 10. 

12. Rekombinantes humanes Chromatinregulator- 
Protein HEZ-2 oder ein Abschnitt davon, erMltlich 
durch Expression einer in Anspruch 4 definierten 
cDNA. 

13. Rekombinantes humanes Chromatinregulator- 
Protein H3— 9 oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 definierten 
cDNA. 

14. Antikorper gegen HEZ-2. 

1 5. Antikorper gegen H3 — 9. 

16. Antisense(desoxy)ribonukleotide mit Komple- 
mentaritat zu einer Teilsequenz einer in Anspruch 
1 definierten DNA. 

17. DNA-Molekiil, kodierend fiir die SET-Domane 
eines Chromatinregulator-Gens, bzw. fiir einen Ab- 
schnitt davon, zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine Deregu- 
lation von Chromatinregulator-Genen, die eine 
SET-Domane aufweisen, zuriickzufiihren sind. 

18. DNA-Molekiil nach Anspruch 6 oder 7 zur Be- 
handlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von Chromat- 
inregulator-Genen, die eine SET-Domane aufwei- 
sen, zuriickzufiihren sind. 

19. Antikorper nach Anspruch 14 oder 15 zur Be- 
handlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von Chromat- 
inregulator-Genen, die eine SET-Domane aufwei- 
sen, zuriickzufiihren sind. 

20. Transgene Maus, enthaltend ein Transgen fiir 
die Expression eines Chromatinregulator-Gens, das 
eine SET-Domane aufweist, oder einer mutierten 
Version eines solchen Proteins. 

21. Transgene Maus, erhaltlich aus embryonalen 
Stammzeiien, in denen die endogenen Maus-Loci 
fur HEZ-2 und H3-9 durch homologe Rekombi- 
nation unterbrochen wurden. 

22. Verfahren zum identifizieren von SSugetier- 
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Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, oder mutierten Versionen davon, da- 
durch gekennzeichnet, daB man Saugetier-cDNA- 
oder genomische DNA-Bibliotheken unter Bedin- 
gungen niedriger Stringenz mit einem DNA-Mole- 5 
kul, kodierend fur die SET-Domane oder einen Ab- 
schnitt davon, hybridisiert. 
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Fig. 1 
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E(z) SDIAGWGIFL KEGAQKNEFI SB^CGEIXSQ DEADRRGKV^ DK..YMCSFL 5C 

KEZ SDVAGWGIFI KDPVQKNEFI SEYCGEITSQ DEADR^GKVY DK..YMCSFL 

hRX SPIHGRGLFC KRNIDAGEMV IEYAGNVXRS IQTOKREKYY DSKGIG.CYM 

trx SHIHGRGLYC TKDIEAGEMV ISYAGELSRS TLTOBC^ERYll DSRGIG.CYM 

C26 SRIHGWGLYA MESIAPDEMI VE±EGQTI^S LV^eS&KAY ERRGIGSSYL 

YHR SAIHNWGLYA LDS IAAKEMI ISYVGERIRQ PVAEMBEKRY LKNGIGSSYL 

su3-9 ANGSG^GVRA ATALRKGEFV CEYIEEIITS DE^ERGKAY DDNG..RTYL 

K3-9 DDGRGWGVRT LEKIRKNSFV MEYVGEIITS EEA£R|GQIY DRQG..ATYL 

G9a TAKM(||^VRA LQTIPQGTFI CEYVGEl|sD AE&D . V_ . RED . .DSYL 

KG-1 TQNKllslRC LDDIAKGSFV CI^A^KlilD DFADKEGL . . EMG . . DEYF 



E{z) £NL& NDFWDATRK ^KIRjAfjls IN|§CYAKVM MVTGDH IOC 

KEZ FNLN NDFWDATRK GNK I RFANflS VNPNCYAKVM MVNGDH 

KRX FRID DSEWDATMH GtfRARFINHS CEPNCYSRVI NI^SQK.... 

trx Skid dnlwdatmr gnaarfiMc ce|ncyskw dilghk. . . . 

C26 IrIS LKHVIDATKR : GKFARFlMs CQPNCYAKVL TIE3EK . . . . 

YHR FRVD SNTVIDATKK GGIARFINHC CDPNCTAKII KVGGRR 

Su3-9 FDLDYNTAQD SEYTIDAANY GKISHFINKS CDPNLAVFPC WIEHLNVAL? 

K3-9 FDLDY...VE DVYTVDAAYY GKISHH^j$S CDPNjLQVYNV FIL.VLDERL? 

G9a FDLDNK . .DG EVYCIDARYY <3&ISRFI»&L CDPSfllPVRV FMLHQDLRF? 

KG-1 ANLDHI. .ES VSYIIDAKLE GNLGRYLKKS CS^jSTLFVCNV FV3 7HDLRF? 



E (z) RIGIFAKRAI QPOEEI^FDY ..RYGPTEQL K FVGI EREM3IV* 

HSZ RIGIFAXRAI QTGEELFFDY . . RYSQADAL K YVGI SP.ZMEIP* 

KRX KIVIFAMRKI YRGEELTYBY . . KFP IE . DA SNKLPCNCGA KKCRKFLN* 

trx RIIIFAVRRI VQGEELTYDY ..KFPFE.D. .EKIPCSCGS KRCRKYLN* 

C26 RIVIYSRTII KKGEEITYDY , . KFP IE . . . DDKIDCLCGA KTCRGYLN* 

YHR RIVIYALRDI AASEELTYDY . . KFEREKDD EERLPCLCGA PNCKGFLN* 

Su3-9 HiVFFTLRPI KAGEELSFDY . IRADNEDVP YENLSTA. J: 

H3-9 RXAFFATRTI RAGEELTFDY NMQVDPVDME STRMDSNFGL AGLPGSPKKR 

G9a RXAFSSSRDI RTGEELGFT)^ GDRFW. . DIK SKYFTCQCGS EKCKHSAEAI 

KG-1 WVAFFASKRI RAG2EL7WDY NYEVG..SVE GKELLCCCGA IECR 



E(z) 
HEZ 

HRX 
trx 
26 
YHR 

3u3-9 VRVECRCGRD .VCRKVLF- 

H 3 - 9 VRIECKCGTE SCRKYLF* 

G3a ALEQSRLARL 3PHPELLPEL G3LPPVNT* 

KG-1 GRLL* 
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E2Z-2 Length: 2607bp (CODING: 90-2330) 
AGGCAG7GGA GCCCCGGCGG CGGCGGCGGC GGCGCGCGGG GGCGACGCGC 



GGGAACAACG CGAGTCGGCG CGCGGGACGA AGAATAAT CA TG GGCCAGAC 
TGGGAAGAAA TCTGAGAAGG GACCAGTTTG TTGGCGGAAG CGTGTAAAAT 
CAGAGTACAT GCGACTGAGA CAGCTCAAGA GGTTCAGACG AGCTGATGAA 
GTAAAGAGTA TGTTTAGTTC CAATCGTCAG AAAATTTTGG AAAGAACGGA 
AATCTTAAAC CAAGAATGGA AACAGCGAAG GATACAGCCT GTGCACATCC 
TGACTTCTGT GAGCTCATTG CGCGGGACTA GGGAGTGTTC GGTGACCAGT 
GACTTGGATT TTCCAACACA AGTCATCCCA TTAAAGACTC TGAATGCAGT 
TGCTTCAGTA CCCATAATGT ATTCTTGGTC TCCCCTACAG CAGAATTTTA 
TGGTGGAAGA TGAAACTGTT TTACATAACA TTCCTTATAT GGGAGATGAA 
GTTTTAGATC AGGATGGTAC TTTCATTGAA GAACTAATAA AAAATTATGA 
TGGGAAAGTA CACGGGGATA GAGAATGTGG GTTTATAAAT GA7GAAA7TT 
TTGTGGAGTT GGTGAATGCC CTTGGTCAAT ATAATGATGA T GAG GAT GAT 
GAT GAT GG AG ACGATCCTGA AGAAAGAGAA GAAAAGCAGA AAGATC7GGA 
GGATCACCGA GATGATAAAG AAAGCCGCCC AC C 7 C G G AAA TTTCCTTCTG 
ATAAAATTTT TGAAGCCATT TCCTCAATGT TTCCAGATAA GGGCACAGCA 
GAAGAACTAA AGGAAAAATA TAAAGAACTC AC CG AACAGC AGCTCCCAGG 
CGCACTTCCT CCTGAATGTA CCCCCAACAT AGATGGACCA AATGCTAAAT 
CTGTTCAGAG AGAGCAAAGC TTACACTCCT TTCATACGCT TTTCTGTAGG 
CGATGTTTTA AATATGACTG CTTCCTACAT CCTTTTCATG CAACACCCAA 
CACTTATAAG CGGAAGAACA CAGAAACAGC TCTAGACAAC AAACCTTGTG 
GACCACAGTG TTACCAGCAT TTGGAGGGAG CAAAGGAGTT TGCTGCTGCT 
CTCACCGCTG AGCGGATAAA GACCCCACCA AAACGTCCAG GAGGCCGCAG 
AAGAGGACGG CTTCCCAATA ACAGTAGCAG GCCCAGCAZC CCCACCA7TA 
ATGTGC7GGA ATCAAAGGAT ACAGACAGTG ATAGGGAAGC AGGGAC7GAA 
ACGGGGGGAG AGAACAATGA TAAAGAAGAA GAAGAGAAGA AAGATGAAAC 
TTCGAGCTCC TCTGAAGCAA ATTCTCGGTG TCAAACACCA ATAAAGA7GA 
AGCCAAA7A7 7GAACCTCC7 GAGAATGTGG AGTGGAG7" TG77GAA3CC 
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1401 


TCAATGTTTA 


GAGTCCTCAT 


TGGCACTTAC 


TATGACAATT 


TCTGTGCCAT 


1451 


TGCTAGGTTA 


ATTGGGACCA 


AAACATGTAG 


ACAGGTGTAT 


GAGTTTAGAG 


1501 


TCAAAGAATC 


TAGCATCATA 


GCTCCAGCTC 


CCGCTGAGGA 


TGTGGATACT 


1551 


CCTCCAAGGA 


AAAAGAAGAG 


GAAACACCGG 


TTGTGGGCTG 


CACACTGCAG 


1601 


AAAGATACAG 


CTGAAAAAGG 


ACGGCTCCTC 


TAACCATGTT 


TACAACTATC 


1651 


AACCCTGTGA 


TCATCCACGG 


CAGCCTTGTG 


ACAGTTCGTG 


CCCTTGTGTG 


1701 


AT AG C AC AAA 


ATTTTTGTGA 


AAAGTTTTGT 


CAATGTAGTT 


CAGAGTGTCA 


1751 


AAACCGCTTT 


CCGGGATGCC 


GCTGCAAAGC 


ACAGTGCAAC 


ACCAAGCAGT 


1801 


GCCCGTGCTA 


CCTGGCTGTC 


CGAGAGTGTG 


ACCCTGACCT 


CTGTCTTACT 


1851 


TGTGGAGCCG 


CTGACCATTG 


GGACAGTAAA 


AATGTGTCCT 


GCAAGAACTG 


1901 


CAGTATTCAG 


CGGGGCTCCA 


AAAAGC AT C T 


ATTGCTGGCA 


CCATCTGACG 


1951 


TGGCAGGCTG 


GGGGATTTTT 


AT C AAAG AT C 


CTGTGCAGAA 


AAATGAATTC 


2001 


ATCTCAGAAT 


ACTGTGGAGA 


GATTATTTCT 


CAAGATGAAG 


CTGACAGAAG 


2051 


AGGGAAAGTG 


TATGATAAAT 


ACATGTGCAG 


CTTTCTGTTC 


AACTTGAACA 


2101 


ATGATTTTGT 


GGTGGATGCA 


ACCCGCAAGG 


GTAACAAAAT 


TCGTTTTGCA 


2151 


AATCATTCGG 


TAAATCCAAA 


CTGCTATGCA 


AAAGTTATGA 


TGGTTAACGG 


2201 


TGATCACAGG 


ATAGGTATTT 


TTGCCAAGAG 


AGCCATCCAG 


ACTGGCGAAG 


2251 
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AGCTGTTTTT 
GGCATCGAAA 


T G ATT AC AG A 
GAGAAATGGA 


TACAGCCAGG 
AATCCCTTGA 


CTGATGCCCT 
CATCTGCTAC 


GAAGTATGTC 
CTCCTCCCCC 


2351 


TCCTCTGAAA 


CAGCTGCCTT 


AGCTTCAGGA 




C T GTCjoQjC AA 


2401 


TTTAGAAAAA 


GAACATGCAG 


TTTGAAATTC 


TGAATTTGCA 


AAGTACTGTA 


2451 


AGAATAA7T7 


ATAGTAATGA 


GTTTAAAAAT 


CAACTTTTTA 


TTGCCTTCTC 


2501 


ACCAGCTGCA 


AAGTGTTTTG 


TACCAGTGAA 


TTTTTGCAAT 


AATGCAGTAT 


2551 


GGTACATTTT 


TCAACTTTGA 


AT AAAG AAT A 


CTTGAACTTG 


TCAAAAAAAA 


2601 


TGTCGAC 
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H3-9 LENGTH: 2747bp (CODING: 53-1291) 

1 GTCGACACTC GCGAGGCCGG CTAGGCCCGA ATGTCGTTAG CCGTGGGGAA 

M 

51 A GATGG CGGA AAATTTAAAA GGCTGCAGCG TGTGTTGCAA GTCTTCTTGG 

101 AATCAGCTGC AGGACCTGTG CCGCCTGGCC AAGCTCTCCT GCCCTGCCCT 

151 CGGTATCTCT AAGAGGAACC TCTATGACTT TGAAGTCGAG TACCTGTGCG 

201 ATTACAAGAA GATCCGCGAA CAGGAATATT ACCTGGTGAA ATGGCGTGGA 

251 TAT CC AG ACT CAGAGAGCAC CTGGGAGCCA CGGCAGAATC TCAAGTGTGT 

301 GCGTATCCTC AAGCAGTTCC ACAAGGACTT AGAAAGGGAG CTGCTCCGGC 

351 GGCACCACCG GTCAAAGACC CCCCGGCACC TGGACCCAAG CTTGGCCAAC 

401 TACCTGGTGC AGAAGGCCAA GCAGAGGCGG GCGCTCCGTC GCTGGGAGCA 

451 GGAGCTCAAT GCCAAGCGCA GCCATCTGGG ACGCATCACT GTAGAGAATG 

501 AGGTGGACCT GGACGGCCCT CCGCGGGCCT TCGTGTACAT CAATGAGTAC 

551 CGTGTTGGTG AGGGCATCAC CCTCAACCAG GTGGCTGTGG GCTGCGAGTG 

601 CCAGGACTGT CTGTGGGCAC CCACTGGAGG CTGCTGCCCG GGGGCGTCAC 

651 TGCACAAGTT TGCCTACAAT GACCAGGGCC AGGTGCGGCT TCGAGCCGGG 

701 CTGCCCATCT ACGAGTGCAA CTCCCGCTGC CGCTGCGGCT ATGACTGCCC 

751 AAATCGTGTG GTACAGAAGG GTATCCGATA TGACCTCTGC ATCTTCCGGA 

801 CGGATGATGG GCGTGGCTGG GGCGTCCGCA CCCTGGAGAA GATTCGCAAG 

8 51 AACAGCTTCG TCATGGAGTA CGTGGGAGAG ATCATTACCT CAGAGGAGGC 

901 AGAGCGGCGG GGCCAGATCT ACGACCGTCA GGGCGCCACC TACCTCTTTG 

951 ACCTGGACTA CGTGGAGGAC GTGTACACCG TGGATGCCGC CTACTATGGC 

1001 AACATCTCCC ACTTTGTCAA CCACAGTTGT GACCCCAACC TGCAGGTGTA 

1051 CAACGTCTTC ATAGACAACC TTGACGAGCG GCTGCCCCGC ATCGCTTTCT 

1101 TTGCCACAAG AACCATCCGG GCAGGCGAGG AGCTCACCTT TGATTACAAC 

1151 ATGCAAGTGG ACCCCGTGGA C AT GG AG AG C ACCCGCATGG ACTCCAACTT 

1201 TGGCCTGGCT GGGCTCCCTG GCTCCCCTAA GAAGCGGGTC CGTATTGAAT 

12 51 GCAAGTGTGG GACTGAGTCC TGCCGCAAAT ACCTCTTC TA GCCCTTAGAA 
1301 GTCTGAGGCC AGACTGACTG AGGGGGCCTG AAGCTACATG CACCTCCCCC 

13 51 ACTGCTGCCC TCCTGTCGAG AATGACTGCC AGGGCCTCGC CTGCCTCCAC 
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CTGCCCCCAC CTGCTCCTAC CTGCTCTACG TTCAGGGCTG TGGCCGTGGT 
GAGGACCGAC TCCAGGAGTC CCCTTTCCCT GTCCCAGCCC CATCTGTGGG 
TTGCACTTAC AAACCCCCAC CCACCTTCAG AAATAGTTTT TCAACATCAA 
GACTCTCTGT CGTTGGGATT CATGGCCTAT TAAGGAGGTC CAAGGGGTGA 
GTCCCAACCC AGCCCCAGAA TATATTTGTT TTTGCACCTG CTTCTGCCTG 
GAGATTGAGG GGTCTGCTGC AGGCCTCCTC CCTGCTGCCC CAAAGGTATG 
GGGAAGCAAC CCCAGAGCAG GCAGACATCA GAGGCCAGAG TGCCTAGCCC 
GACATGAAGC TGGTTCCCCA ACCACAGAAA CTTTGTACTA GTGAAAGAAA 
GGGGTCCCTG GCCTACGGGC TGAGGCTGGT TTCTGCTCGT GCTTACAGTG 
CTGGGTAGTG TTGGCCCTAA GAGCTGTAGG GTCTCTTCTT CAGGGCTGCA 
TATCTGAGAA GTGGATGCCC ACATGCCACT GGAAGGGAAG TGGGTGTCCA 
TGGGCCACTG AGCAGTGAGA GGAAGGCAGT GCAGAGCTGG CCAGCCCTGG 
AGGTAGGCTG GGACCAAGCT CTGCCTTCAC AGTGCAGTGA AGGTACCTAG 
GGCTCTTGGG AGCTCTGCGG TTGCTAGGGG CCCTGACCTG GGGTGTCATG 
ACCGCTGACA CCACTCAGAG CTGGAACCAA GATCTAGATA GTCCGTAGAT 
AGCACTTAGG ACAAGAATGT GCATTGATGG GGTGGTGATG AGGTGCCAGG 
CACTAGGTAG AGCACCTGGT CCACGTGGAT TGTCTCAGGG AAGCCTTGAA 
AACCACGGAG GTGGATGCCA GGAAAGGGCC CATGTGGCAG AAGGCAAAGT 
ACAGGCCAAG AATTGGGGGT GGGGGAGATG GCTTCCCCAC TATGGGATGA 
CGAGGCGAGA GGGAAGCCCT TGCTGCCTGC CATTCCCAGA CCCCAGCCCT 
TTGTGCTCAC CCTGGTTCCA CTGGTCTCAA AAGTCACCTG CCTACAAATG 
TACAAAAGGC GAAGGTTCTG ATGGCTGCCT TGCTCCTTGC TCCCCCACCC 
CCTGTGAGGA CTTCTC7AGG AAGTCCTTCC TGACTACCTG TGCCCAGAG7 
GCCCCTACAT GAGACTGTAT GCCCTGCTAT CAGATGCCAG ATCTATGTC-T 
CTGTCTGTGT G7CCATCCCG CCGGCZZCCC AGACTAACCT 7CAGGCATG3 
ACTGAATCTG GTTCTCCTCT TGTACACCCC TCAACCCTAT GCAGCCTGGA 
GTGGGCATCA ATAAAA7GAA CTGTC3ACTG AAAAAAAAAA TGTCGAC 
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HEZ-2 
HEZ-1 



B52 



1844 TCTTACTTGTGGAGCCGCTGACCATTGGGACAGTAAAAATGTGTCCTGCA 1893 
I 1 M 1 I I I I Mi i II I I I I I I I I I II II Mill I 

1 ACTCACCTGTGGGGCCTCAGAGCACTGGGACTGCAAGGTGGTTTCCTGTA 50 



1894 
51 
1944 
101 



AGAACTGCAGT ATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGC ACCA 1943 
I I I IN I I I I I I I I I I I I I I I I I I I I I I i I I I II II 
AAAACTGCAGCATCCAGCGTGGACTTAAGAAGCACCTGCTGCTGGCCCCC 100 
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